29. 录屏视频:在 Python 里进行模型诊断——第一部分

在 Python 里进行模型诊断

这里 是逻辑回归 sklearn 包的相关文献,另外, 这里 是处理混淆矩阵的相关文献。

在这个视频结尾,wikipedia 中的文档实际上与 sklearn 的输出相反。预测结果位于纵列中,而实际结果位于行中。因此,

Predicted (预测值)
Actual(实际值) 0 1
0 23 1
1 14 2
  • 因此,在我们预测的未入学人数中,有 23 人未入学。
  • 在我们预测的未入学人数中,有 14 人已入学。
  • 在我们预测的已入学人数中,有 1 人未入学。
  • 在我们预测的已入学人数中,有 2 人已入学。

为什么使用训练测试拆分法以及一些附加文献

这里 是 sklearn 逻辑回归的文献。 这里 是混淆矩阵的参考文献。

在这个视频中,你创建了一个训练测试数据集,这在机器学习中十分常见。一般来说,将数据拆分为训练数据与测试数据是一种十分有效的方法,这不仅能保证你的模型可以准确预测拟合的数据,也能预测它从未见过的数据。一旦证明你的模型能够准确预测测试数据,就可以确保它在其他预测案例中也能表现出色,比如预测未来的学生或是交易状况等等。